네이버 커넥트 AI Tech Week 1 보충 학습 (numpy, pandas) 5-1강: Exception / File / Log Handling List의 Index 범위를 넘어갈 때 변환할 수 없는 문자/숫자를 변환할 때 컴퓨터는 text 파일을 처리하기 위해 binary 파일로 변환시킴 (예: pyc 파일) 모든 text 파일도 실제는 binary 파일, ASCII/Unicode 문자열 집합으로 저장되어 사람이 읽을 수 있음 메모장에 저장된 파일, HTML 파일,... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 AI Tech Day 33 (Advanced Self-supervised Pre-training Models) 9강: Self-supervised Pre-training Models BERT, GPT-3, XLNet, ALBERT, RoERTa, Reformer, T5, ELECTRA... GPT-1 < S >,< E >,$ 등의 다양한 special token을 활용하여 fine-tuning시의 성능을 극대화 한다. BERT Masked Language Model 80%는 [MASK]로 치환된다. ... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 AI Tech Day 6 (DL 역사, MLP, Matplotlib) 1강: Historical Review 데이터 MSE = \cfrac{1}{N}\sum \limits_{i=1}^{N}\sum \limits_{d=1}^{D}(y_i^{(d)}-\hat{y_i}^{(d)})^2 MSE=N1 i=1∑N d=1∑D (yi(d) −yi ^ (d))2 CE = -\cfrac{1}{N}\sum \limits_{i=1}^{N}\sum \limits_{d=1}^{D}y_... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 Ai tech Day 52 Task 설계 → 필요 데이터 수집 → 통계학적 분석 → 전처리 → Tagging → Tokenizing → 모델 설계 → 모델 구현 → 성능 평가 → 완료 Token 개수 → 아웃라이어 제거 개행문자 제거 특수문자 제거 공백 제거 중복 표현 제어 (ㅋㅋㅋㅋㅋ, ㅠㅠㅠㅠ, ...) 제목 제거 조사 제거 모두 대문자로 변환 문자열의 첫 문자를 대문자로 변환 문자열에서 각 단어의 첫 문자를 대문... 부스트 캠프네이버 커넥트네이버 커넥트 Ai tech Day7 미분(differentiation)은 변수의 움직임에 따른 함수값의 변화를 측정하기 위한도구 최근엔 미분을 손으로 직접 계산하는 대신 컴퓨터가 계산해줄 수 있습니다. 미분은 함수 f의 주어진 점 (x, f(x))에서의 접선의 기울기를 구한다. 한 점에서 접선의 기울기를 알면 어느 방향으로 점을 움직여야 함수 값이 증가하는지 / 감소하는지 알 수 있다. 미분 값을 더하면 경사상승법(gradie... 부스트 캠프네이버 커넥트네이버 커넥트 Ai tech Day4 속성(variable)과 행동(method)의 개념을 가진 객체 지향 프로그래밍 뱀 처럼 늘여쓰기, 파이썬 함수/변수명에 사용한다. 낙타의 등 모양, 파이썬 Class명에 사용한다. Attribute 추가는 __init__, self를 사용한다. (__init__: 객체 초기화 예약 함수) __str__: 객체를 print 할 때 실행되는 함수 method(Action) 추가는 기존 함수와 ... 네이버 커넥트부스트 캠프네이버 커넥트
AI Tech Week 1 보충 학습 (numpy, pandas) 5-1강: Exception / File / Log Handling List의 Index 범위를 넘어갈 때 변환할 수 없는 문자/숫자를 변환할 때 컴퓨터는 text 파일을 처리하기 위해 binary 파일로 변환시킴 (예: pyc 파일) 모든 text 파일도 실제는 binary 파일, ASCII/Unicode 문자열 집합으로 저장되어 사람이 읽을 수 있음 메모장에 저장된 파일, HTML 파일,... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 AI Tech Day 33 (Advanced Self-supervised Pre-training Models) 9강: Self-supervised Pre-training Models BERT, GPT-3, XLNet, ALBERT, RoERTa, Reformer, T5, ELECTRA... GPT-1 < S >,< E >,$ 등의 다양한 special token을 활용하여 fine-tuning시의 성능을 극대화 한다. BERT Masked Language Model 80%는 [MASK]로 치환된다. ... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 AI Tech Day 6 (DL 역사, MLP, Matplotlib) 1강: Historical Review 데이터 MSE = \cfrac{1}{N}\sum \limits_{i=1}^{N}\sum \limits_{d=1}^{D}(y_i^{(d)}-\hat{y_i}^{(d)})^2 MSE=N1 i=1∑N d=1∑D (yi(d) −yi ^ (d))2 CE = -\cfrac{1}{N}\sum \limits_{i=1}^{N}\sum \limits_{d=1}^{D}y_... 네이버 커넥트부스트캠프 AI Tech네이버 커넥트 Ai tech Day 52 Task 설계 → 필요 데이터 수집 → 통계학적 분석 → 전처리 → Tagging → Tokenizing → 모델 설계 → 모델 구현 → 성능 평가 → 완료 Token 개수 → 아웃라이어 제거 개행문자 제거 특수문자 제거 공백 제거 중복 표현 제어 (ㅋㅋㅋㅋㅋ, ㅠㅠㅠㅠ, ...) 제목 제거 조사 제거 모두 대문자로 변환 문자열의 첫 문자를 대문자로 변환 문자열에서 각 단어의 첫 문자를 대문... 부스트 캠프네이버 커넥트네이버 커넥트 Ai tech Day7 미분(differentiation)은 변수의 움직임에 따른 함수값의 변화를 측정하기 위한도구 최근엔 미분을 손으로 직접 계산하는 대신 컴퓨터가 계산해줄 수 있습니다. 미분은 함수 f의 주어진 점 (x, f(x))에서의 접선의 기울기를 구한다. 한 점에서 접선의 기울기를 알면 어느 방향으로 점을 움직여야 함수 값이 증가하는지 / 감소하는지 알 수 있다. 미분 값을 더하면 경사상승법(gradie... 부스트 캠프네이버 커넥트네이버 커넥트 Ai tech Day4 속성(variable)과 행동(method)의 개념을 가진 객체 지향 프로그래밍 뱀 처럼 늘여쓰기, 파이썬 함수/변수명에 사용한다. 낙타의 등 모양, 파이썬 Class명에 사용한다. Attribute 추가는 __init__, self를 사용한다. (__init__: 객체 초기화 예약 함수) __str__: 객체를 print 할 때 실행되는 함수 method(Action) 추가는 기존 함수와 ... 네이버 커넥트부스트 캠프네이버 커넥트